-
Stable Diffusion 3来啦!提示文本理解更好,图像质量更强
2月23日,著名大模型开源平台stability.ai在官网推出了——Stable Diffusion 3。 该版本与Stable Diffusion 2相比,在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强,可对标闭源模型Midjourney。 Stable Diffusion 3的参数在8亿——80亿之间,也就是说Stable Diffusion 3可能是专为移…...- 0
- 6
-
Stable Diffusion XL 1.0上线 生成图片更快、更稳定
7月11日,文本生成图片平台Stability AI宣布推出扩散模型Stable Diffusion XL 1.0版本,并且可以在discord上进行测试。据悉,Stable Diffusion XL 1.0可以通过文本直接生成风景、肖像、动物、物品等多种类型图片,与之前相比更快、更稳定,自由可控。 Stable Diffusion XL 1.0主要新功能如下: 多种控制和定制:用户可以根据自己的…...- 0
- 39
-
Stable Diffusion动画版上线 支持多种输入方式
当地时间5月11日,开源生成式AI公司Stable AI发布了一款全新的动画生成工具Stable Animation SDK。这是一款专为艺术家与开发人员设计的工具,旨在帮助艺术家和开发人员运用最先进的稳定扩散模型生成动画。借助Stable Animation SDK,使用者可以调用包括Stable Diffusion 2.0、Stable Diffusion XL在内的所有Stable Diff…...- 0
- 94
-
Stable Video 3D上线 单个图片生成高质量3D视频
3月19日,Stability AI继推出文生图Stable Diffusion、文生视频Stable Video Diffusion之后,上线了图像直接生成3D视频模型——Stable Video 3D。 该模型基于Stable Video Diffusion打造,能够显著提升3D生成的质量和多视角一致性,效果要优于之前Stability AI推出的Stable Zero123以及丰田研究院和哥…...- 0
- 1
-
Stable Audio亮相 文本直接生成20多种背景音乐
9月14日,著名开源平台Stability AI在官网发布了音频AIGC产品Stable Audio。用户通过文本提示就能直接生成摇滚、爵士、电子、嘻哈、重金属、民谣、流行、朋克、乡村等20多种类型背景音乐。 目前,Stable Audio有免费和付费两个版本,免费版每月可生成20个音乐,最大时长45秒,不能用于商业;付费版每月11.99美元(约87元),可生成500个音乐,最大时长90秒,可用于…...- 0
- 22
-
Stable Doodle重磅发布 文本+草图直接生成3D图片
7月14日,Stability AI在官网宣布推出Stable Doodle。Stable Doodle是一款通过文本提示+草图可直接生成高精准图片的产品,现在免费对外开放。用户只需要登录平台官网,无需注册,绘制一个草图,接着输入描述,即可生成图片。如果想要图片精准度更高,还可以选择不同的图片样式,甚至可以直接选择3D样式。 免费在线体验地址:https://clipdrop.co/stable-…...- 0
- 48
-
Stability AI发布语言模型StableLM 与OpenAI正面交锋
最近,Stable Diffusion背后的公司Stability AI推出了一款名为StableLM的新产品,其功能类似于OpenAI AI聊天机器人ChatGPT。 据了解,该公司将提供两种型号的StableLM,较小的版本提供30亿个参数的复杂度,而“较大”的版本有70亿个参数。该公司表示,它计划发布15至650亿个参数的更复杂模型。今天发布的两个alpha版本均可用于商业和研究目的。 St…...- 0
- 41
-
阿里推出视频模型:AtomoVideo文本+图片生成视频
阿里巴巴集团的技术团队推出了文本+图片生成高保真视频模型——AtomoVideo。 用户通过AtomoVideo只需要提供高清图片和简单的文本提示,就能快速生成高清视频并保留逼真的细节。 根据评测数据显示,AtomoVideo生成的视频在动作连贯性、图片一致性、时序一致性、运动强度等方面超过了VideoCrafter、I2VGEN-XL、SVD开源模型,可媲美商业模型Gen-2和Pika。 论文地…...- 0
- 8
-
开源文本生成图片模型 训练成本降低16倍
众所周知,Stable Diffusion是目前最强开源文本生成图片的扩散模型之一,但对于那些没有A100、H100的中小企业、个人开发者来说有一个很大缺点,需要花费高昂的训练成本。为了解决这一痛点,Wuerstchen开源模型采用了一种全新的技术架构,在保证图片质量的情况下实现了42倍极限压缩。 以512x512尺寸的训练图片为例,Stable Diffusion1.4需要150000小时的GP…...- 0
- 21
-
亚马逊云科技助力金山办公智启办公新体验
随着科技不断发展,人工智能现已掀起新一轮技术浪潮,在多行业、多领域深入交汇,给诸多应用场景带来了长足的发展。人工智能与办公领域软件的结合,对于办公系统的用户体验、工作效率、后端管理操作等一系列的内容都将有巨大提升,未来的发展令人期待。 金山办公成立于1988年,其旗舰产品 WPS Office在海外已拥有超过1亿的月活用户,适配超过 46 种语言,成为全球主流办公软件产品之一。在金山办公拓展全球业…...- 0
- 5
-
阿里云serverless应用引擎2.0正式公测
8月7日,阿里云Serverless应用引擎 SAE2.0正式公测上线!全面升级后的SAE2.0具备极简体验、标准开放、极致弹性三大优势,应用冷启动全面提效,秒级完成创建发布应用,应用成本下降 40%以上。 SAE2.0本次升级带来三大全新能力: 产品使用更简单,应用零改造上线,零学习成本,秒级完成创建发布应用,同时按照实际使用量付费,应用成本下降40%以上; 其次,标准更加开放,基于容器标准构建…...- 0
- 15
-
开源文本生成图片模型SDXL 1.0发布
在大模型开启的AIGC时代,由初创公司Stability AI打造的文本到图像生成模型 Stable Diffusion可谓风靡全球。虽然从文本到图像的生成模型并不少,但Stable Diffusion却是最受欢迎的开源模型。各路开发者也基于Stable Diffusion模型进行二创,推出各种各样、花式繁多的 AIGC 应用。 7月27日,著名开源平台Stability AI发布了文本生成图片模…...- 0
- 35